科普一下，什么是gpu算力？

#科普一下，什么是gpu算力？| 来源: 网络整理| 查看: 265

算力字面意义就是计算能力。但是计算有很多，比如浮点计算、整数计算、超越函数计算等等，浮点计算还有双精度计算、单精度计算，整数也一样。所以通俗来讲，算力就是单位时间内硬件能够完成某种运算的量。

为什么需要区分不同种类的计算呢？因为在硬件上针对不同的计算有不同的计算单元，比如单精度浮点计算有专门的浮点运算单元，超越函数如果有硬件加速，也有相应的硬件单元，整型计算也有相应的硬件单元。因此同一设备上，不同的计算类型，算力是不同的。以浮点单元算力为例，一般浮点算力的单位为 GFLOPS/s、TFLOPS/s， 1 FLOP 是指一次乘法或者一次加法，1 GFLOPS 是 1024/1000 FLOPS。因此无论是 CPU 还是 GPU其算力概念并无差异，仅仅是计算资源不同而已。以 Arm A76 为例，其拥有 2 条 128 bit FMA pipeline，因此其算力为 2 x 4 x 2 x 频率，第一个 2 是 2 条 pipeline，第二个 4 是 128-bit 为4 个 32-bit 浮点，最后一个 2 是 FMA 是乘加计算，因此一条 FMA 是 2 FLOPS。所以 A76 的算力是 16 x 频率。

那么对于 GPU 是否也是这样呢？理论是没有错的，只是在具体问题需要具体分析一下，例如 Qualcomm 的 Adreno，Arm 的 Mali 这样的 GPU，其浮点计算只能由浮点计算单元完成，因此其算力与 CPU 一样，由其浮点计算单元的吞吐乘以频率计算。但是对于 NVIDIA 的 GPU，则有所不同，其在 Volta 架构开始引入 Tensor Core，该硬件单元支持 FP16 精度的 4x4 矩阵乘加指令，HMMA，也就是说一条指令可以完成 128 FLOPs 的计算(64次乘法，64次加法)，那么，该硬件的峰值就是浮点计算单元算力 + Tensor Core的算力。以上是关于硬件算力的简单描述，也指硬件的峰值算力，但是在实际应用中是否能达到硬件峰值算力，则会受更多因素的影响。

有兴趣可以参考大佬文章，了解更多关于峰值的内容

参考资料:

【本文地址】

科普一下，什么是gpu算力？

科普一下，什么是gpu算力？

今日新闻

推荐新闻